knitr::opts_chunk$set(echo = TRUE)

# Packages utilisés
library(config) # Utilisation d'un fichier de configuration, cf  https://db.rstudio.com/best-practices/managing-credentials/#stored-in-a-file-with-config
library(tidyverse)
library(DBI) # pour les connexions aux BDD
library(RPostgreSQL) # driver postgres
library(RMariaDB) # driver MariaDB
library(RMySQL) # driver MySQL
library(lubridate) # calcul sur les dates

library(httr) #
library(jsonlite) # Gestion format json

library("readxl") # Lecture de fichiers xlsx

library(sf) # Traitement de données géoréférencées
library(mapview) # Affichage de données géoréférencées
library(plotly) # Graphiques interactifs
library(leaflet) # Cartes interactives

# Fonction pour requêter l'API Hub'Eau

get_hubeau <- function(path, query) {
  
  response <- GET(url = path, query = query) %>% 
  content(as = "text", encoding = "UTF-8") %>%
  fromJSON(flatten = TRUE)
  
data = response$data # Le jeu de données est dans l'objet "data"

if(response$count > query$size) { # Si la taille de page est plus petite que le nb de résultats, faire une boucle pour les pages suivantes
  
pages <- ceiling(response$count/query$size)

# Affichage d'une barre de progression
pb <- winProgressBar(title = "Récupération des chroniques", min = 0,
                     max = pages, width = 300)

for(i in 2:pages){
  
  query$page <- i
  
  response_i <- GET(url = path, query = query) %>% 
  content(as = "text", encoding = "UTF-8") %>%
  fromJSON(flatten = TRUE)

data <- rbind(data, response_i$data) # Concaténation des lignes récupérées

setWinProgressBar(pb, i, title=paste( round(i/pages*100, 0), "% chargé")) # Avancement de la barre de progression

} # Fin boucle for

close(pb)

} # Fin if

return(data)
  } # Fin get_hubeau

# Insertion de données

db.insertion <- function(con,table,data) {
  
  # Date de la dernière donnée en base
  Date_max <- tbl(con, table) %>% summarise(Date_max = max(Date_de_la_mesure, na.rm = TRUE)) %>% pull(Date_max)
  if(is.na(Date_max)) Date_max <- as.Date(params$date_debut)-1
  
  # Données plus récentes à insérer
  data <- data %>% filter(Date_de_la_mesure > Date_max)
  
  # Existe-t-il des données à insérer ?
if (isTRUE(data %>% tally() > 0)) {
  
  # Insertion des nouvelles lignes
  dbWriteTable(con, table, data, overwrite=FALSE, append=TRUE,
             fileEncoding="latin1")
  
  # Horodate en commentaire
mise_a_jour <- paste0(format.Date(Sys.Date(),"%d/%m/%Y"), " : Actualisation ",params$actualisation)

dbGetQuery(con, paste0("ALTER TABLE ",table," COMMENT = '",mise_a_jour,"';"))

paste0("Données insérées : ",data%>%tally)

}
  else {
    
    paste0("Aucune donnée à insérer depuis le ", format.Date(Date_max,"%d/%m/%Y"))
  
    }
  
} # fin db.insertion

Connexion aux bases de données pour l’intégration des données importées


# Base Mariadb OEB - eau_tbi
con_eau_tbi <- dbConnect(RMariaDB::MariaDB(), default.file = '../../.my.cnf', groups="mysql_oeb",
dbname = "eau_tbi")

# Base MariaDB OEB - référentiels
con_referentiels <- dbConnect(RMariaDB::MariaDB(), default.file = '../../.my.cnf', groups="mysql_oeb",
dbname = "eau_referentiels")

# Base Postgres (développement)

conf <- config::get("postgres_dev")

con_postgresql_dev <- DBI::dbConnect(odbc::odbc(),
                          Driver       = conf$driver,
                          servername   = conf$server,
                          UID = conf$uid,
                          PWD = conf$pwd,
                          Port = conf$port,
                          database = 'eau',
                             encoding = "latin1")

Collecte des données de la base Naïades à partir de l’API Hydrobiologie du portail Hub’eau

Documentation de l’API : https://hubeau.eaufrance.fr/page/api-hydrobiologie


# Récupération des infos sur les stations de mesure

# Liste des paramètres de la requête
query_sites = list(
  code_departement= params$num_departement,
  format='json',
  size=params$pagination
  )

# Requête des stations
hubeau_sites <- get_hubeau(path = params$api_sites, query = query_sites)

# Conversion au format géographique
sites <- st_as_sf(hubeau_sites, coords = c("coordonnee_x", "coordonnee_y"), 
    crs = 2154, agr = "constant")

# Récupération des résultats d'indices biologiques

# Liste des paramètres de la requête (lot 1 de départements)
query_resultats = list(
                 #code_departement = params$num_departement,
                 code_departement = "29,22,35",
                 code_indice = params$codes_parametres,
                 #les paramètres date_debut et date_fin créent un bug dans l'API https://github.com/BRGM/hubeau/issues/81
                 #date_debut_prelevement = params$date_debut,
                 #date_fin_prelevement = params$date_fin,
                 size = params$pagination,
                 format = 'json')

# Requête des chroniques
hubeau_resultats <- get_hubeau(path = params$api_resultats, query=query_resultats)

# Liste des paramètres de la requête (lot 2 de départements)
query_resultats = list(
                 #code_departement = params$num_departement,
                 code_departement = "56,50,44,49,53",
                 code_indice = params$codes_parametres,
                 #les paramètres date_debut et date_fin créent un bug dans l'API https://github.com/BRGM/hubeau/issues/81
                 #date_debut_prelevement = params$date_debut,
                 #date_fin_prelevement = params$date_fin,
                 size = params$pagination,
                 format = 'json')

# Requête des chroniques
hubeau_resultats <- get_hubeau(path = params$api_resultats, query=query_resultats)%>%union(hubeau_resultats)

# Conversion au format géographique
resultats <- st_as_sf(hubeau_resultats, coords = c("coordonnee_x", "coordonnee_y"), 
    crs = 2154, agr = "constant")

Les stations de mesure et les chroniques d’analyses sont récupérées sur les départements 22,29,35,56,50,44,49,53 sur la période , via la fonction get_hubeau(path, query) définie ci-dessus.

Les départements séparés en deux lots pour respecter les contraintes de nb de lignes totales récupérées par requête.

Import des référentiels géographiques

Les polygones des territoires de SAGE bretons sont récupérées depuis le flux WFS de la DREAL Bretagne, ils correspondent au périmètre géographique des données à bancariser.

# couche des SAGEs bretons depuis Geobretagne
sages <- st_read("https://geobretagne.fr/geoserver/dreal_b/sage_dreal/wfs?SERVICE=WFS&REQUEST=GetCapabilities")
Reading layer `dreal_b:sage_dreal' from data source 
  `https://geobretagne.fr/geoserver/dreal_b/sage_dreal/wfs?SERVICE=WFS&REQUEST=GetCapabilities' using driver `WFS'
Simple feature collection with 21 features and 7 fields
Geometry type: MULTISURFACE
Dimension:     XY
Bounding box:  xmin: 123903.4 ymin: 6703536 xmax: 422117.4 ymax: 6882053
Projected CRS: RGF93 / Lambert-93
# pb pas moyen de manipuler cet objet => solution sur
# https://gis.stackexchange.com/questions/389814/r-st-centroid-geos-error-unknown-wkb-type-12/389854#389854
ensure_multipolygons <- function(X) {
  tmp1 <- tempfile(fileext = ".gpkg")
  tmp2 <- tempfile(fileext = ".gpkg")
  st_write(X, tmp1)
  gdalUtilities::ogr2ogr(tmp1, tmp2, f = "GPKG", nlt = "MULTIPOLYGON")
  Y <- st_read(tmp2)
  st_sf(st_drop_geometry(X), geom = st_geometry(Y))
}

sages <- ensure_multipolygons(sages)
Writing layer `file1678231e7beb' to data source `C:\Users\tbesse\AppData\Local\Temp\RtmpYrWJEH\file1678231e7beb.gpkg' using driver `GPKG'
Writing 21 features with 7 fields and geometry type Multi Surface.
Reading layer `file1678231e7beb' from data source `C:\Users\tbesse\AppData\Local\Temp\RtmpYrWJEH\file1678334e4c1c.gpkg' using driver `GPKG'
Simple feature collection with 21 features and 7 fields
Geometry type: MULTIPOLYGON
Dimension:     XY
Bounding box:  xmin: 123903.4 ymin: 6703536 xmax: 422117.4 ymax: 6882053
Projected CRS: RGF93 / Lambert-93
# couche des Hydroécorégions de niveau 2

her2 <- st_read("https://services.sandre.eaufrance.fr/geo/mdo?SERVICE=WFS&VERSION=2.0.0&REQUEST=GetFeature&typename=Hydroecoregion2")%>%
  st_transform(2154)
Reading layer `Hydroecoregion2' from data source 
  `https://services.sandre.eaufrance.fr/geo/mdo?SERVICE=WFS&VERSION=2.0.0&REQUEST=GetFeature&typename=Hydroecoregion2' 
  using driver `GML'
Simple feature collection with 114 features and 5 fields
Geometry type: MULTIPOLYGON
Dimension:     XY
Bounding box:  xmin: -4.79495 ymin: 41.36882 xmax: 9.560037 ymax: 51.08965
Geodetic CRS:  WGS 84

Sélection des sites et des résultats sur les territoires des SAGE bretons

Les sites et résultats téléchargés sont sélectionnés sur le périmètre géographique retenu, par jointure avec la couche des SAGE.


sites_sages <- sites %>% 
  st_join(sages) %>% 
  filter(!is.na(cd_sage))

resultats_sages <- resultats %>% 
  st_join(sages) %>% 
  filter(!is.na(cd_sage)) %>% 
  st_join(her2)

Les sites font-ils partie du réseau RCS ?

L’information sur le réseau de suivi est incluse dans les données sur les sites fournies par l’API. Le réseau RCS correspond au code SANDRE : 0000000052

sites_rcs <- sites_sages %>%
  # rowwise pour préciser que les opérations se font pour chaque ligne
  rowwise()%>%
  # Le code 0000000052 (RCS) est dans la liste des codes_réseaux
  mutate(inclus_rcs = '0000000052' %in% unlist(codes_reseaux))%>%
  select(code_station_hydrobio, inclus_rcs)

Carte des sites importés via Hub’eau, par département

sites_sages %>%
  ggplot()+
  geom_sf(data=sages)+
geom_sf(aes(color=libelle_departement))

Carte des résultats importés via Hub’eau, par qualification

resultats_sages %>%
  ggplot()+
  geom_sf(data=sages)+
geom_sf(aes(color=libelle_qualification))

Exemple de résulat : Carte de l’indice Diatomées (IBD)

resultats_sages %>%
  filter(code_indice == '5856')%>% #5856 IBD Indice Diatomées
  ggplot()+
  geom_sf(data=sages)+
geom_sf(aes(color=resultat_indice))

Jointure avec les tables référentiels

Sites inconnus

Les sites importés sont comparés à la table des sites bancarisés précédemment, par code SANDRE.

Liste des sites inconnus :

sites_inconnus <- sites_sages %>%
  # tables des sites
  left_join(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","site")), by=c("code_station_hydrobio" = "code"), copy=TRUE, suffix = c("", ".site"))%>%
  filter(is.na(site_id))

sites_inconnus %>% 
  distinct(code_station_hydrobio, libelle_station_hydrobio)

Carte des sites inconnus :

sites_inconnus %>%
  ggplot()+
  geom_sf(data=sages)+
geom_sf(aes(color=libelle_departement))

Mise en forme des nouveaux sites en fonction du schema de la table des sites bancarisés


insert_sites <- sites_inconnus %>%
  mutate(coord_x = st_coordinates(st_transform(geometry, 2154))[,1],
         coord_y = st_coordinates(st_transform(geometry, 2154))[,2],
         longitude_wgs84 = st_coordinates(st_transform(geometry, 4326))[,1],
         latitude_wgs84 = st_coordinates(st_transform(geometry, 4326))[,2],
         typesite_id = '1',
         projection_id = '2154',
         source = 'OFB/NAIADES',
         maj = format(Sys.Date(),"%Y-%m-%d")
         )%>% 
  as_tibble() %>%
select(code = code_station_hydrobio,
libelle = libelle_station_hydrobio,
typesite_id,
coord_x,
coord_y,
projection_id,
longitude_wgs84,
latitude_wgs84,
source,
maj)

insert_sites
NA

Insertion des nouveaux sites

Table de correspondance site / territoires (EGA - Entités Geographiques et Administratives)

La table de correspondance est issue de la jointure spatiale entre la table des sites et les différentes échelles de territoires bretons : Région, Départements, EPCI, SAGE, Contrats de territoires

correspondance_site_ega <- tbl(con_postgresql_dev, dbplyr::in_schema("eau_referentiel","geo_correspondance_site_ega"))%>%
  mutate(typesite = 'SITE')

correspondance_site_ega

Liste des paramètres bancarisés

La liste des paramètres est issue du dictionnaire national des données sur l’eau (SANDRE).


liste_parametres <- as.list(strsplit(params$codes_parametres, ",")[[1]])

parametres <- tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","parametre"))%>%
  collect() %>%
  filter(code %in% liste_parametres)

parametres

Seuils de qualité DCE

La liste des seuils de qualité est produite à partir de l’Arrêté du 27 juillet 2018 disponible sur Legifrance[^footnote]

[^footnote] Arrêté du 27 juillet 2018 modifiant l’arrêté du 25 janvier 2010 relatif aux méthodes et critères d’évaluation de l’état écologique, de l’état chimique et du potentiel écologique des eaux de surface pris en application des articles R. 212-10, R. 212-11 et R. 212-18 du code de l’environnement - Légifrance (legifrance.gouv.fr)

Table complète

Table des résultats avec les attributs des référentiels

table_indices <- resultats_sages %>%
  mutate(CoordX_WGS84 = st_coordinates(st_transform(geometry, 4326))[,1],
         CoordY_WGS84 = st_coordinates(st_transform(geometry, 4326))[,2],
         date_prelevement = as.Date(date_prelevement)
         )%>%
  as_tibble()%>%
  # tables des paramètres
  left_join(parametres, by=c("code_indice"="code"), suffix = c("", ".parametre"))%>%
  # Unité inconnue --> code sandre 0
  # n (nombre) --> code sandre 214
  # ‰ vs SMOW --> code sandre 32
  mutate(unite_code = case_when(unite_indice == "Unité inconnue" ~ '0',
                                  unite_indice == "n" ~ '214',
                                  unite_indice == "‰ vs SMOW" ~ '32',
                                  TRUE ~ unite_indice),
         resultat_indice = ifelse(resultat_indice == 999, NA, resultat_indice)) %>%
  # tables des unités
  left_join(tbl(con_postgresql_dev, dbplyr::in_schema("eau_referentiel","unite")), by=c("unite_code" = "code"), copy=TRUE, suffix = c("", ".unite"))%>%
  # tables des sites
  left_join(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","site")), by=c("code_station_hydrobio" = "code"), copy=TRUE, suffix = c("", ".site"))

table_indices 

Synthèse des données manquantes

# Synthèse des données manquantes
table_indices %>%
  summarise(
    nb_lignes = n(),
    lignes_sans_parametre = sum(is.na(parametre_id)),
    lignes_sans_unite = sum(is.na(unite_id)),
    lignes_sans_sites = sum(is.na(site_id))
  )

# Unités inconnues de la table de référence
table_indices %>% filter(is.na(unite_id)) %>% distinct(unite_indice)

# Stations inconnues de la table des sites
table_indices %>% filter(is.na(site_id)) %>% distinct(libelle_station_hydrobio)

# Liste des codes indices
table_indices %>% distinct(code_indice)
NA

Classes des indices

Attribution des classes de qualité aux résultats par paramètre (indice biologique)

table_indices_classes <- table_indices %>% 
  left_join(classes_qualite, by = c("parametre_id"), copy = TRUE, suffix=c("",".classe")) %>%
  filter(resultat_indice < borne_sup_exclue & resultat_indice >= borne_inf_inclue)

table_indices_classes

Exploration des données

Données disponibles par an et par indice

table_indices_classes %>%
  group_by(year(date_prelevement), libelle_support, libelle_indice) %>%
  summarise(Nb_resultats = n(),
            Annee = year(date_prelevement)) %>%
  ggplot(aes(x = as.factor(Annee), y=Nb_resultats, fill=libelle_indice))+
           geom_bar(stat="identity")+
  facet_grid(libelle_support~.)
`summarise()` has grouped output by 'year(date_prelevement)', 'libelle_support', 'libelle_indice'. You can override using the `.groups` argument.

NA

Distribution des résultats par indice et par classe de qualité

table_indices_classes %>%
  arrange(code.x)%>%
  ggplot(aes(x = code.x, y=resultat_indice, fill = code.x))+
           geom_boxplot()+
  facet_wrap(~libelle_indice, scales = "free")

  
table_indices_classes

Transformation des données

Données annuelles

Données aggrégées par année d’analyse :

  • Indices moyens
  • Classes maximales

table_indices_classes_annee <- table_indices_classes %>%
  mutate(Annee = year(as.Date(date_prelevement))) %>%
  group_by(code_station_hydrobio,
           longitude_wgs84,
           latitude_wgs84,
           libelle_support,
           code_indice,
           parametre_id,
           libelle,
           symbole,
           Annee) %>%
  summarise(classe = as.integer(max(code.x)), 
            resultat_indice = mean(resultat_indice),
            resultat_qualification = as.integer(max(code_qualification)))
`summarise()` has grouped output by 'code_station_hydrobio', 'longitude_wgs84', 'latitude_wgs84', 'libelle_support', 'code_indice', 'parametre_id', 'libelle', 'symbole'. You can override using the `.groups` argument.
table_indices_classes_annee

Classe de qualité biologique globale

Calcul d’une classe de qualité biologique globale (maximum des classes des indices annuels)

table_indices_classe_globale_annee <- table_indices_classes_annee %>%
  group_by(code_station_hydrobio, longitude_wgs84, latitude_wgs84, Annee)%>%
  summarise(Resultat = max(classe))%>%
  mutate(Serie = 'Classe - Qualité biologique Globale', 
         libelle_support = 'Qualité biologique Globale',
         symbole = 'X')
`summarise()` has grouped output by 'code_station_hydrobio', 'longitude_wgs84', 'latitude_wgs84'. You can override using the `.groups` argument.
table_indices_classe_globale_annee

Import des données en base

Données au format de la table eau_structure.analyse_bio_esu - serveur PostgreSQL DEV

Mise en forme de la table


analyse_bio_esu <- table_indices %>%
  filter(!is.na(resultat_indice))%>%
  left_join(select(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","date")), date_id, date_du_jour), by=c("date_prelevement" = "date_du_jour"), copy=TRUE)%>%
  left_join(select(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","support")), support_id, code), by=c("code_support" = "code"), copy=TRUE)%>%
  left_join(select(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","remarque")), remarque_id, code), by=c("code_qualification" = "code"), copy=TRUE)%>%
  mutate(prelevement_code = paste0(code_station_hydrobio,date_id),
         rdd_id = 0,
         milieu_id = 3,
         fraction_id = 22,
         limite_quantification = 0,
         source = 'OFB/NAIADES',
         maj = format(Sys.Date(),"%Y-%m-%d"))%>%
  select(site_id,
         date_id,
         rdd_id,
         prelevement_code,
         milieu_id,
         support_id,
         fraction_id,
         parametre_id,
         resultat = resultat_indice,
         remarque_id,
         limite_quantification,
         source,
         maj)

analyse_bio_esu

Sélection des nouvelles lignes à insérer


insert_analyse_bio_esu <- analyse_bio_esu

Insertion des nouvelles lignes

Données au format de la table eau_tbi.oeb_eau_qualite_biologique_ce - serveur MariaDB OEB


table_series_indices <- table_indices_classes_annee %>% 
  mutate(indice = paste(libelle, code_indice, sep=' - '))%>%
  pivot_longer(cols= c("classe","resultat_indice","resultat_qualification"))%>%
  mutate(Serie = case_when(name == 'classe' ~ paste('Classe',libelle_support,sep = ' - '),
                           name == 'resultat_indice' ~ paste('Indice',indice,sep = ' - '),
                           name == 'resultat_qualification' ~ paste('Qualification',indice,sep = ' - ')
                           )
         )%>%
  group_by(code_station_hydrobio,
           longitude_wgs84,
           latitude_wgs84,
           libelle_support,
           Serie,
           symbole,
           Annee)%>%
  summarise(Resultat = max(value))%>%
  ungroup()%>%
  union(table_indices_classe_globale_annee)
`summarise()` has grouped output by 'code_station_hydrobio', 'longitude_wgs84', 'latitude_wgs84', 'libelle_support', 'Serie', 'symbole'. You can override using the `.groups` argument.
table_series_indices

Déclinaison par combinaison SITE / EGA

La table de valorisation décline les résultats pour chaque échelle de territoire

table_series_indices_ega <- table_series_indices%>%
  # table des correspondances sites / UGA
  left_join(correspondance_site_ega, by=c("code_station_hydrobio" = "cdsite"), copy = TRUE)%>%
  left_join(sites_rcs, by="code_station_hydrobio")

table_series_indices_ega

Mise en forme de la table


oeb_eau_qualite_biologique_ce <- table_series_indices_ega %>%
  mutate(Periode = as.character(Annee),
         Source = 'OFB/NAIADES',
         Mise_a_jour = format(Sys.Date(),"%Y-%m-%d")
         )%>% 
  select(Type_entitite_geographique = typesite,
         Code_entitite_geographique = code_station_hydrobio,
         Libelle_entitite_geographique = lbsite,
         CoordX_WGS84 = longitude_wgs84,
         CoordY_WGS84 = latitude_wgs84,
         Reseau_RCS = inclus_rcs,
         Type_entitite_geographique_associee = typeega,
         Code_entitite_geographique_associee = cdega,
         Libelle_entitite_geographique_associee = lbega,
         Periode,
         Serie,
         unite = symbole,
         Resultat,
         Source,
         Mise_a_jour
  )

oeb_eau_qualite_biologique_ce
NA

Sélection des lignes nouvelles à insérer

La table de résultats est comparée aux données déjà bancarisées par une jointure d’exclusion (anti_join). Les lignes restantes peuvent être insérées.


insert_oeb_eau_qualite_biologique_ce <- oeb_eau_qualite_biologique_ce %>% 
  ungroup() %>%
  # Retirer les lignes des résultats déjà existants dans la table
  anti_join(tbl(con_eau_tbi,"oeb_eau_qualite_biologique_ce", by=c("Type_entitite_geographique", "Code_entitite_geographique", "Type_entitite_geographique_associee", "Code_entitite_geographique_associee", "Periode", "Serie")), copy = TRUE)%>%
  # Retirer les stations hydro sans EGA identifiée
  filter(!is.na(Type_entitite_geographique))%>%
  # Retirer les lignes avec une valeur NA
  drop_na()
Joining, by = c("Type_entitite_geographique", "Code_entitite_geographique", "Libelle_entitite_geographique", "CoordX_WGS84", "CoordY_WGS84", "Reseau_RCS", "Type_entitite_geographique_associee", "Code_entitite_geographique_associee", "Libelle_entitite_geographique_associee", "Periode", "Serie", "unite", "Resultat", "Source", "Mise_a_jour")
insert_oeb_eau_qualite_biologique_ce

Insertion des nouvelles lignes

Exports CSV pour la publication du jeu de données sur les portails opendata

Export pour le GIDE

Fichier pour la publication du jeu de données sur le portail OEB

# Depuis la base de données
#tbl(con_eau_tbi, "oeb_eau_qualite_biologique_ce_new")%>%
# ou depuis la table en mémoire
oeb_eau_qualite_biologique_ce %>%  
write.table(file = paste0(params$path_dataviz,"\\GIDE\\","oeb_eau_qualite_biologique_ce.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")

Export pour GEOB

Fichier pour la publication du jeu de données sur Geobretagne

Mise en forme de la table pour l’ensemble des paramètres

oeb_eau_qualite_geob <- table_series_indices  %>%
  ungroup()%>%
  left_join(select(sites_sages,code_station_hydrobio,libelle_station_hydrobio), by="code_station_hydrobio")  %>%
  mutate(Code_entitite_geographique = code_station_hydrobio,
         Libelle_entitite_geographique = libelle_station_hydrobio,
         CoordX_WGS84 = longitude_wgs84,
         CoordY_WGS84 = latitude_wgs84,
         Serie,
         unite = symbole,
         Type_entitite_geographique = 'SITE',
         Source = 'OFB/NAIADES',
         Mise_a_jour = format(Sys.Date(),"%Y-%m-%d")) %>%
  select(Type_entitite_geographique,
         Code_entitite_geographique,
         Libelle_entitite_geographique,
         CoordX_WGS84,
         CoordY_WGS84,
         Serie,
         unite,
         Source,
         Mise_a_jour,
         Annee,
         Resultat) %>%
  pivot_wider(values_from = Resultat, names_from = Annee, names_sort=TRUE)

Export pour le paramètre “Qualité globale”


oeb_eau_qualite_geob  %>%
  filter(Serie == 'Classe - Qualité biologique Globale')  %>%
write.table(file = paste0(params$path_dataviz,"\\GEOB\\","oeb_eau_qualite_biologique_globale.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")

Export pour le paramètre “Diatomées”


oeb_eau_qualite_geob %>%
  filter(Serie == 'Classe - Diatomées benthiques') %>%
write.table(file = paste0(params$path_dataviz,"\\GEOB\\","oeb_eau_qualite_diatomees.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")

Export pour le paramètre “Macroinvertébrés”


oeb_eau_qualite_geob %>%
  filter(Serie == 'Classe - Macroinvertébrés aquatiques') %>%
write.table(file = paste0(params$path_dataviz,"\\GEOB\\","oeb_eau_qualite_macroinvertebres.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")

Export pour le paramètre “Macrophytes”


oeb_eau_qualite_geob %>%
  filter(Serie == 'Classe - Macrophytes') %>%
write.table(file = paste0(params$path_dataviz,"\\GEOB\\","oeb_eau_qualite_macrophytes.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")
---
title: "Integration des données hydrobiologiques"
output: html_document
params:
  api_sites: https://hubeau.eaufrance.fr/api/vbeta/hydrobio/stations_hydrobio?
  api_resultats: https://hubeau.eaufrance.fr/api/vbeta/hydrobio/indices?
  num_departement: '22,29,35,56,50,44,49,53'
  codes_parametres: '7036,5910,1022,5856,2928,6959,6951,6955,1000,2527'
  date_debut: '2017-01-01'
  date_fin: '2019-12-31'
  pagination: 5000
  path_dataviz: O:\04.DATAVISUALISATION\INDICATEURS_BIOLOGIE\DCE_ETAT_BIOLOGIQUE
---

```{r setup}
knitr::opts_chunk$set(echo = TRUE)

# Packages utilisés
library(config) # Utilisation d'un fichier de configuration, cf  https://db.rstudio.com/best-practices/managing-credentials/#stored-in-a-file-with-config
library(tidyverse)
library(DBI) # pour les connexions aux BDD
library(RPostgreSQL) # driver postgres
library(RMariaDB) # driver MariaDB
library(RMySQL) # driver MySQL
library(lubridate) # calcul sur les dates

library(httr) #
library(jsonlite) # Gestion format json

library("readxl") # Lecture de fichiers xlsx

library(sf) # Traitement de données géoréférencées
library(mapview) # Affichage de données géoréférencées
library(plotly) # Graphiques interactifs
library(leaflet) # Cartes interactives

# Fonction pour requêter l'API Hub'Eau

get_hubeau <- function(path, query) {
  
  response <- GET(url = path, query = query) %>% 
  content(as = "text", encoding = "UTF-8") %>%
  fromJSON(flatten = TRUE)
  
data = response$data # Le jeu de données est dans l'objet "data"

if(response$count > query$size) { # Si la taille de page est plus petite que le nb de résultats, faire une boucle pour les pages suivantes
  
pages <- ceiling(response$count/query$size)

# Affichage d'une barre de progression
pb <- winProgressBar(title = "Récupération des chroniques", min = 0,
                     max = pages, width = 300)

for(i in 2:pages){
  
  query$page <- i
  
  response_i <- GET(url = path, query = query) %>% 
  content(as = "text", encoding = "UTF-8") %>%
  fromJSON(flatten = TRUE)

data <- rbind(data, response_i$data) # Concaténation des lignes récupérées

setWinProgressBar(pb, i, title=paste( round(i/pages*100, 0), "% chargé")) # Avancement de la barre de progression

} # Fin boucle for

close(pb)

} # Fin if

return(data)
  } # Fin get_hubeau

# Insertion de données

db.insertion <- function(con,table,data) {
  
  # Date de la dernière donnée en base
  Date_max <- tbl(con, table) %>% summarise(Date_max = max(Date_de_la_mesure, na.rm = TRUE)) %>% pull(Date_max)
  if(is.na(Date_max)) Date_max <- as.Date(params$date_debut)-1
  
  # Données plus récentes à insérer
  data <- data %>% filter(Date_de_la_mesure > Date_max)
  
  # Existe-t-il des données à insérer ?
if (isTRUE(data %>% tally() > 0)) {
  
  # Insertion des nouvelles lignes
  dbWriteTable(con, table, data, overwrite=FALSE, append=TRUE,
             fileEncoding="latin1")
  
  # Horodate en commentaire
mise_a_jour <- paste0(format.Date(Sys.Date(),"%d/%m/%Y"), " : Actualisation ",params$actualisation)

dbGetQuery(con, paste0("ALTER TABLE ",table," COMMENT = '",mise_a_jour,"';"))

paste0("Données insérées : ",data%>%tally)

}
  else {
    
    paste0("Aucune donnée à insérer depuis le ", format.Date(Date_max,"%d/%m/%Y"))
  
    }
  
} # fin db.insertion
```

# Connexion aux bases de données pour l'intégration des données importées

```{r connexion_bd}

# Base Mariadb OEB - eau_tbi
con_eau_tbi <- dbConnect(RMariaDB::MariaDB(), default.file = '../../.my.cnf', groups="mysql_oeb",
dbname = "eau_tbi")

# Base MariaDB OEB - référentiels
con_referentiels <- dbConnect(RMariaDB::MariaDB(), default.file = '../../.my.cnf', groups="mysql_oeb",
dbname = "eau_referentiels")

# Base Postgres (développement)

conf <- config::get("postgres_dev")

con_postgresql_dev <- DBI::dbConnect(odbc::odbc(),
                          Driver       = conf$driver,
                          servername   = conf$server,
                          UID = conf$uid,
                          PWD = conf$pwd,
                          Port = conf$port,
                          database = 'eau',
                             encoding = "latin1")
```
# Collecte des données de la base Naïades à partir de l'API Hydrobiologie du portail Hub'eau

**Documentation de l'API :** https://hubeau.eaufrance.fr/page/api-hydrobiologie

```{r hubeau}

# Récupération des infos sur les stations de mesure

# Liste des paramètres de la requête
query_sites = list(
  code_departement= params$num_departement,
  format='json',
  size=params$pagination
  )

# Requête des stations
hubeau_sites <- get_hubeau(path = params$api_sites, query = query_sites)

# Conversion au format géographique
sites <- st_as_sf(hubeau_sites, coords = c("coordonnee_x", "coordonnee_y"), 
    crs = 2154, agr = "constant")

# Récupération des résultats d'indices biologiques

# Liste des paramètres de la requête (lot 1 de départements)
query_resultats = list(
                 #code_departement = params$num_departement,
                 code_departement = "29,22,35",
                 code_indice = params$codes_parametres,
                 #les paramètres date_debut et date_fin créent un bug dans l'API https://github.com/BRGM/hubeau/issues/81
                 #date_debut_prelevement = params$date_debut,
                 #date_fin_prelevement = params$date_fin,
                 size = params$pagination,
                 format = 'json')

# Requête des chroniques
hubeau_resultats <- get_hubeau(path = params$api_resultats, query=query_resultats)

# Liste des paramètres de la requête (lot 2 de départements)
query_resultats = list(
                 #code_departement = params$num_departement,
                 code_departement = "56,50,44,49,53",
                 code_indice = params$codes_parametres,
                 #les paramètres date_debut et date_fin créent un bug dans l'API https://github.com/BRGM/hubeau/issues/81
                 #date_debut_prelevement = params$date_debut,
                 #date_fin_prelevement = params$date_fin,
                 size = params$pagination,
                 format = 'json')

# Requête des chroniques
hubeau_resultats <- get_hubeau(path = params$api_resultats, query=query_resultats)%>%union(hubeau_resultats)

# Conversion au format géographique
resultats <- st_as_sf(hubeau_resultats, coords = c("coordonnee_x", "coordonnee_y"), 
    crs = 2154, agr = "constant")
```
Les stations de mesure et les chroniques d'analyses sont récupérées sur les départements `r params$num_departement` sur la période , via la fonction *get_hubeau(path, query)* définie ci-dessus.

- path : adresse de l'API
- query : liste des paramètres de requête avec leurs valeurs (code_)

Les départements séparés en deux lots pour respecter les contraintes de nb de lignes totales récupérées par requête.

# Import des référentiels géographiques

Les polygones des territoires de SAGE bretons sont récupérées depuis le flux WFS de la DREAL Bretagne, ils correspondent au périmètre géographique des données à bancariser.

```{r couche_sages}
# couche des SAGEs bretons depuis Geobretagne
sages <- st_read("https://geobretagne.fr/geoserver/dreal_b/sage_dreal/wfs?SERVICE=WFS&REQUEST=GetCapabilities")

# pb pas moyen de manipuler cet objet => solution sur
# https://gis.stackexchange.com/questions/389814/r-st-centroid-geos-error-unknown-wkb-type-12/389854#389854
ensure_multipolygons <- function(X) {
  tmp1 <- tempfile(fileext = ".gpkg")
  tmp2 <- tempfile(fileext = ".gpkg")
  st_write(X, tmp1)
  gdalUtilities::ogr2ogr(tmp1, tmp2, f = "GPKG", nlt = "MULTIPOLYGON")
  Y <- st_read(tmp2)
  st_sf(st_drop_geometry(X), geom = st_geometry(Y))
}

sages <- ensure_multipolygons(sages)

# couche des Hydroécorégions de niveau 2

her2 <- st_read("https://services.sandre.eaufrance.fr/geo/mdo?SERVICE=WFS&VERSION=2.0.0&REQUEST=GetFeature&typename=Hydroecoregion2")%>%
  st_transform(2154)
```
# Sélection des sites et des résultats sur les territoires des SAGE bretons

Les sites et résultats téléchargés sont sélectionnés sur le périmètre géographique retenu, par jointure avec la couche des SAGE.

```{r selection sur les territoires des SAGEs}

sites_sages <- sites %>% 
  st_join(sages) %>% 
  filter(!is.na(cd_sage))

resultats_sages <- resultats %>% 
  st_join(sages) %>% 
  filter(!is.na(cd_sage)) %>% 
  st_join(her2)

```

## Les sites font-ils partie du réseau RCS ?

L'information sur le réseau de suivi est incluse dans les données sur les sites fournies par l'API. Le réseau RCS correspond au code SANDRE : 0000000052

```{r sites_rcs}
sites_rcs <- sites_sages %>%
  # rowwise pour préciser que les opérations se font pour chaque ligne
  rowwise()%>%
  # Le code 0000000052 (RCS) est dans la liste des codes_réseaux
  mutate(inclus_rcs = '0000000052' %in% unlist(codes_reseaux))%>%
  select(code_station_hydrobio, inclus_rcs)
```

## Carte des sites importés via Hub'eau, par département

```{r carte_sites}
sites_sages %>%
  ggplot()+
  geom_sf(data=sages)+
geom_sf(aes(color=libelle_departement))
```
## Carte des résultats importés via Hub'eau, par qualification

```{r carte_resultats}
resultats_sages %>%
  ggplot()+
  geom_sf(data=sages)+
geom_sf(aes(color=libelle_qualification))
```
## Exemple de résulat : Carte de l'indice Diatomées (IBD)
```{r carte_indice}
resultats_sages %>%
  filter(code_indice == '5856')%>% #5856 IBD Indice Diatomées
  ggplot()+
  geom_sf(data=sages)+
geom_sf(aes(color=resultat_indice))
```

# Jointure avec les tables référentiels

## Sites inconnus

Les sites importés sont comparés à la table des sites bancarisés précédemment, par code SANDRE.

Liste des sites inconnus :

```{r sites_inconnus}
sites_inconnus <- sites_sages %>%
  # tables des sites
  left_join(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","site")), by=c("code_station_hydrobio" = "code"), copy=TRUE, suffix = c("", ".site"))%>%
  filter(is.na(site_id))

sites_inconnus %>% 
  distinct(code_station_hydrobio, libelle_station_hydrobio)
```
Carte des sites inconnus :

```{r carte_sites_inconnus}
sites_inconnus %>%
  ggplot()+
  geom_sf(data=sages)+
geom_sf(aes(color=libelle_departement))
```

### Mise en forme des nouveaux sites en fonction du schema de la table des sites bancarisés

```{r table sites_inconnus}

insert_sites <- sites_inconnus %>%
  mutate(coord_x = st_coordinates(st_transform(geometry, 2154))[,1],
         coord_y = st_coordinates(st_transform(geometry, 2154))[,2],
         longitude_wgs84 = st_coordinates(st_transform(geometry, 4326))[,1],
         latitude_wgs84 = st_coordinates(st_transform(geometry, 4326))[,2],
         typesite_id = '1',
         projection_id = '2154',
         source = 'OFB/NAIADES',
         maj = format(Sys.Date(),"%Y-%m-%d")
         )%>% 
  as_tibble() %>%
select(code = code_station_hydrobio,
libelle = libelle_station_hydrobio,
typesite_id,
coord_x,
coord_y,
projection_id,
longitude_wgs84,
latitude_wgs84,
source,
maj)

insert_sites

```
### Insertion des nouveaux sites 

```{r insert sites_inconnus, eval=FALSE, include=FALSE}

sf::dbWriteTable(conn = con_postgresql_dev, name = Id(schema = "eau_structure",table = "site"), value = insert_sites, overwrite=FALSE, append=TRUE, fileEncoding="latin1")
```

## Table de correspondance site / territoires (EGA - Entités Geographiques et Administratives)

La table de correspondance est issue de la jointure spatiale entre la table des sites et les différentes échelles de territoires bretons : Région, Départements, EPCI, SAGE, Contrats de territoires

```{r import_eau_correspondance_site_ega}
correspondance_site_ega <- tbl(con_postgresql_dev, dbplyr::in_schema("eau_referentiel","geo_correspondance_site_ega"))%>%
  mutate(typesite = 'SITE')

correspondance_site_ega
```
## Liste des paramètres bancarisés

La liste des paramètres est issue du dictionnaire national des données sur l'eau (SANDRE).

```{r import parametres}

liste_parametres <- as.list(strsplit(params$codes_parametres, ",")[[1]])

parametres <- tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","parametre"))%>%
  collect() %>%
  filter(code %in% liste_parametres)

parametres
```

## Seuils de qualité DCE

La liste des seuils de qualité est produite à partir de l'[Arrêté du 27 juillet 2018](https://www.legifrance.gouv.fr/jorf/article_jo/JORFARTI000037347782) disponible sur Legifrance[^footnote] 

[^footnote] [Arrêté du 27 juillet 2018 modifiant l'arrêté du 25 janvier 2010 relatif aux méthodes et critères d'évaluation de l'état écologique, de l'état chimique et du potentiel écologique des eaux de surface pris en application des articles R. 212-10, R. 212-11 et R. 212-18 du code de l'environnement - Légifrance (legifrance.gouv.fr)](https://www.legifrance.gouv.fr/jorf/article_jo/JORFARTI000037347782)

```{r import seuils de qualité}

classes_qualite <- tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","join_parametre_classe"))%>%
  left_join(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","classe")), by="classe_id")%>%
  left_join( select(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","parametre")),parametre_id,libelle, code), by="parametre_id")%>%
  collect()%>%
  filter(parametre_id %in% parametres$parametre_id,
         valide == 1)

classes_qualite %>%
  select(libelle.y, code.y, parametre_id, libelle_court, code.x, borne_inf_inclue, borne_sup_exclue, source)
```

## Table complète

Table des résultats avec les attributs des référentiels

```{r table indices}
table_indices <- resultats_sages %>%
  mutate(CoordX_WGS84 = st_coordinates(st_transform(geometry, 4326))[,1],
         CoordY_WGS84 = st_coordinates(st_transform(geometry, 4326))[,2],
         date_prelevement = as.Date(date_prelevement)
         )%>%
  as_tibble()%>%
  # tables des paramètres
  left_join(parametres, by=c("code_indice"="code"), suffix = c("", ".parametre"))%>%
  # Unité inconnue --> code sandre 0
  # n (nombre) --> code sandre 214
  # ‰ vs SMOW --> code sandre 32
  mutate(unite_code = case_when(unite_indice == "Unité inconnue" ~ '0',
                                  unite_indice == "n" ~ '214',
                                  unite_indice == "‰ vs SMOW" ~ '32',
                                  TRUE ~ unite_indice),
         resultat_indice = ifelse(resultat_indice == 999, NA, resultat_indice)) %>%
  # tables des unités
  left_join(tbl(con_postgresql_dev, dbplyr::in_schema("eau_referentiel","unite")), by=c("unite_code" = "code"), copy=TRUE, suffix = c("", ".unite"))%>%
  # tables des sites
  left_join(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","site")), by=c("code_station_hydrobio" = "code"), copy=TRUE, suffix = c("", ".site"))

table_indices 
```
### Synthèse des données manquantes

```{r donnees_manquantes}
# Synthèse des données manquantes
table_indices %>%
  summarise(
    nb_lignes = n(),
    lignes_sans_parametre = sum(is.na(parametre_id)),
    lignes_sans_unite = sum(is.na(unite_id)),
    lignes_sans_sites = sum(is.na(site_id))
  )

# Unités inconnues de la table de référence
table_indices %>% filter(is.na(unite_id)) %>% distinct(unite_indice)

# Stations inconnues de la table des sites
table_indices %>% filter(is.na(site_id)) %>% distinct(libelle_station_hydrobio)

# Liste des codes indices
table_indices %>% distinct(code_indice)

```

## Classes des indices

Attribution des classes de qualité aux résultats par paramètre (indice biologique)

```{r classe_indices}
table_indices_classes <- table_indices %>% 
  left_join(classes_qualite, by = c("parametre_id"), copy = TRUE, suffix=c("",".classe")) %>%
  filter(resultat_indice < borne_sup_exclue & resultat_indice >= borne_inf_inclue)

table_indices_classes
```

# Exploration des données

## Données disponibles par an et par indice

```{r graphe_indices, fig.height=8, fig.width=16}
table_indices_classes %>%
  group_by(year(date_prelevement), libelle_support, libelle_indice) %>%
  summarise(Nb_resultats = n(),
            Annee = year(date_prelevement)) %>%
  ggplot(aes(x = as.factor(Annee), y=Nb_resultats, fill=libelle_indice))+
           geom_bar(stat="identity")+
  facet_grid(libelle_support~.)
  
```

## Distribution des résultats par indice et par classe de qualité

```{r graphe_indices_classes, fig.height=8, fig.width=16}
table_indices_classes %>%
  arrange(code.x)%>%
  ggplot(aes(x = code.x, y=resultat_indice, fill = code.x))+
           geom_boxplot()+
  facet_wrap(~libelle_indice, scales = "free")
  
table_indices_classes
```

# Transformation des données

## Données annuelles

Données aggrégées par année d'analyse :

- Indices moyens
- Classes maximales

```{r table_indices_classes_annee}

table_indices_classes_annee <- table_indices_classes %>%
  mutate(Annee = year(as.Date(date_prelevement))) %>%
  group_by(code_station_hydrobio,
           longitude_wgs84,
           latitude_wgs84,
           libelle_support,
           code_indice,
           parametre_id,
           libelle,
           symbole,
           Annee) %>%
  summarise(classe = as.integer(max(code.x)), 
            resultat_indice = mean(resultat_indice),
            resultat_qualification = as.integer(max(code_qualification)))

table_indices_classes_annee
```

## Classe de qualité biologique globale 

Calcul d'une classe de *qualité biologique globale* (maximum des classes des indices annuels)

```{r}
table_indices_classe_globale_annee <- table_indices_classes_annee %>%
  group_by(code_station_hydrobio, longitude_wgs84, latitude_wgs84, Annee)%>%
  summarise(Resultat = max(classe))%>%
  mutate(Serie = 'Classe - Qualité biologique Globale', 
         libelle_support = 'Qualité biologique Globale',
         symbole = 'X')

table_indices_classe_globale_annee
```

# Import des données en base

## Données au format de la table eau_structure.analyse_bio_esu - serveur PostgreSQL DEV

### Mise en forme de la table

```{r analyse_bio_esu}

analyse_bio_esu <- table_indices %>%
  filter(!is.na(resultat_indice))%>%
  left_join(select(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","date")), date_id, date_du_jour), by=c("date_prelevement" = "date_du_jour"), copy=TRUE)%>%
  left_join(select(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","support")), support_id, code), by=c("code_support" = "code"), copy=TRUE)%>%
  left_join(select(tbl(con_postgresql_dev, dbplyr::in_schema("eau_structure","remarque")), remarque_id, code), by=c("code_qualification" = "code"), copy=TRUE)%>%
  mutate(prelevement_code = paste0(code_station_hydrobio,date_id),
         rdd_id = 0,
         milieu_id = 3,
         fraction_id = 22,
         limite_quantification = 0,
         source = 'OFB/NAIADES',
         maj = format(Sys.Date(),"%Y-%m-%d"))%>%
  select(site_id,
         date_id,
         rdd_id,
         prelevement_code,
         milieu_id,
         support_id,
         fraction_id,
         parametre_id,
         resultat = resultat_indice,
         remarque_id,
         limite_quantification,
         source,
         maj)

analyse_bio_esu
```

### Sélection des nouvelles lignes à insérer

```{r insert_analyse_bio_esu}
# TODO comparaison avec la base
insert_analyse_bio_esu <- analyse_bio_esu

```

### Insertion des nouvelles lignes

```{r insert resultats_inconnus, eval=FALSE, include=FALSE}
dbExecute(con_postgresql_dev, "TRUNCATE TABLE eau_structure.analyse_bio_esu")

dbAppendTable(conn = con_postgresql_dev, name = Id(schema = "eau_structure",table = "analyse_bio_esu"), value = insert_analyse_bio_esu, fileEncoding="latin1")
```

## Données au format de la table eau_tbi.oeb_eau_qualite_biologique_ce - serveur MariaDB OEB

```{r series_indices_annuels}

table_series_indices <- table_indices_classes_annee %>% 
  mutate(indice = paste(libelle, code_indice, sep=' - '))%>%
  pivot_longer(cols= c("classe","resultat_indice","resultat_qualification"))%>%
  mutate(Serie = case_when(name == 'classe' ~ paste('Classe',libelle_support,sep = ' - '),
                           name == 'resultat_indice' ~ paste('Indice',indice,sep = ' - '),
                           name == 'resultat_qualification' ~ paste('Qualification',indice,sep = ' - ')
                           )
         )%>%
  group_by(code_station_hydrobio,
           longitude_wgs84,
           latitude_wgs84,
           libelle_support,
           Serie,
           symbole,
           Annee)%>%
  summarise(Resultat = max(value))%>%
  ungroup()%>%
  union(table_indices_classe_globale_annee)

table_series_indices
```
### Déclinaison par combinaison SITE / EGA

La table de valorisation décline les résultats pour chaque échelle de territoire

```{r table_series_indices_ega}
table_series_indices_ega <- table_series_indices%>%
  # table des correspondances sites / UGA
  left_join(correspondance_site_ega, by=c("code_station_hydrobio" = "cdsite"), copy = TRUE)%>%
  left_join(sites_rcs, by="code_station_hydrobio")

table_series_indices_ega
```
### Mise en forme de la table

```{r table oeb_eau_qualite_biologique_ce}

oeb_eau_qualite_biologique_ce <- table_series_indices_ega %>%
  mutate(Periode = as.character(Annee),
         Source = 'OFB/NAIADES',
         Mise_a_jour = format(Sys.Date(),"%Y-%m-%d")
         )%>% 
  select(Type_entitite_geographique = typesite,
         Code_entitite_geographique = code_station_hydrobio,
         Libelle_entitite_geographique = lbsite,
         CoordX_WGS84 = longitude_wgs84,
         CoordY_WGS84 = latitude_wgs84,
         Reseau_RCS = inclus_rcs,
         Type_entitite_geographique_associee = typeega,
         Code_entitite_geographique_associee = cdega,
         Libelle_entitite_geographique_associee = lbega,
         Periode,
         Serie,
         unite = symbole,
         Resultat,
         Source,
         Mise_a_jour
  )

oeb_eau_qualite_biologique_ce

```
### Sélection des lignes nouvelles à insérer

La table de résultats est comparée aux données déjà bancarisées par une jointure d'exclusion (anti_join). Les lignes restantes peuvent être insérées.

```{r table insert_oeb_eau_qualite_biologique_ce}

insert_oeb_eau_qualite_biologique_ce <- oeb_eau_qualite_biologique_ce %>% 
  ungroup() %>%
  # Retirer les lignes des résultats déjà existants dans la table
  anti_join(tbl(con_eau_tbi,"oeb_eau_qualite_biologique_ce", by=c("Type_entitite_geographique", "Code_entitite_geographique", "Type_entitite_geographique_associee", "Code_entitite_geographique_associee", "Periode", "Serie")), copy = TRUE)%>%
  # Retirer les stations hydro sans EGA identifiée
  filter(!is.na(Type_entitite_geographique))%>%
  # Retirer les lignes avec une valeur NA
  drop_na()

insert_oeb_eau_qualite_biologique_ce
```

### Insertion des nouvelles lignes

```{r insert oeb_eau_qualite_biologique_ce, eval=FALSE, include=FALSE}
dbExecute(con_eau_tbi, "TRUNCATE TABLE oeb_eau_qualite_biologique_ce")

dbAppendTable(conn = con_eau_tbi, name = "oeb_eau_qualite_biologique_ce", value = insert_oeb_eau_qualite_biologique_ce, fileEncoding="latin1")
```

## Exports CSV pour la publication du jeu de données sur les portails opendata

### Export pour le GIDE

Fichier pour la publication du jeu de données sur le portail OEB

```{r export oeb_eau_qualite_biologique_ce}
# Depuis la base de données
#tbl(con_eau_tbi, "oeb_eau_qualite_biologique_ce_new")%>%
# ou depuis la table en mémoire
oeb_eau_qualite_biologique_ce %>%  
write.table(file = paste0(params$path_dataviz,"\\GIDE\\","oeb_eau_qualite_biologique_ce.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")
```

### Export pour GEOB

Fichier pour la publication du jeu de données sur Geobretagne

#### Mise en forme de la table pour l'ensemble des paramètres

```{r oeb_eau_qualite_geob}
oeb_eau_qualite_geob <- table_series_indices  %>%
  ungroup()%>%
  left_join(select(sites_sages,code_station_hydrobio,libelle_station_hydrobio), by="code_station_hydrobio")  %>%
  mutate(Code_entitite_geographique = code_station_hydrobio,
         Libelle_entitite_geographique = libelle_station_hydrobio,
         CoordX_WGS84 = longitude_wgs84,
         CoordY_WGS84 = latitude_wgs84,
         Serie,
         unite = symbole,
         Type_entitite_geographique = 'SITE',
         Source = 'OFB/NAIADES',
         Mise_a_jour = format(Sys.Date(),"%Y-%m-%d")) %>%
  select(Type_entitite_geographique,
         Code_entitite_geographique,
         Libelle_entitite_geographique,
         CoordX_WGS84,
         CoordY_WGS84,
         Serie,
         unite,
         Source,
         Mise_a_jour,
         Annee,
         Resultat) %>%
  pivot_wider(values_from = Resultat, names_from = Annee, names_sort=TRUE)
```

#### Export pour le paramètre "Qualité globale"


```{r export oeb_eau_qualite_biologique_globale}

oeb_eau_qualite_geob  %>%
  filter(Serie == 'Classe - Qualité biologique Globale')  %>%
write.table(file = paste0(params$path_dataviz,"\\GEOB\\","oeb_eau_qualite_biologique_globale.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")
```

#### Export pour le paramètre "Diatomées"

```{r export oeb_eau_qualite_diatomees}

oeb_eau_qualite_geob %>%
  filter(Serie == 'Classe - Diatomées benthiques') %>%
write.table(file = paste0(params$path_dataviz,"\\GEOB\\","oeb_eau_qualite_diatomees.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")
```

#### Export pour le paramètre "Macroinvertébrés"

```{r export oeb_eau_qualite_macroinvertebres}

oeb_eau_qualite_geob %>%
  filter(Serie == 'Classe - Macroinvertébrés aquatiques') %>%
write.table(file = paste0(params$path_dataviz,"\\GEOB\\","oeb_eau_qualite_macroinvertebres.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")
```

#### Export pour le paramètre "Macrophytes"

```{r export oeb_eau_qualite_macrophytes}

oeb_eau_qualite_geob %>%
  filter(Serie == 'Classe - Macrophytes') %>%
write.table(file = paste0(params$path_dataviz,"\\GEOB\\","oeb_eau_qualite_macrophytes.csv"), quote = TRUE, sep = ";",
            eol = "\n", na = "", dec = ",",
            fileEncoding = "UTF-8")
```